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数据 驱动 下 人 文 社会 科学 领域 研究 态势 分 析 


一 一 基于 2010 -2019 年 国家 社会 科学 项 目的 实证 研究 


EEWO HTE GbEU 
' 华中 师范 大 学 信息 管理 学 院 
华东 师范 大 学 调查 与 数据 中 心 ”上海 200241 


武汉 430079 “华东 师范 大 学 经 济 与 管理 学 部 ”上海 200062 


摘 要 : [目的 /意义 ] 在 数据 成 为 关键 生产 要 素 和 基础 战略 资源 的 背景 下 ,梳理 人 文 社会 科学 领域 中 数据 相关 研究 的 发 
展现 状 ,揭示 数据 问题 的 研究 态势 ,为 透视 数据 驱动 下 的 人 文 社会 科学 研究 提供 窗口 。[ 方 法 /过 程 ] 以 2010 - 
2019 年 间 与 数据 有 关 的 国家 社会 科学 基金 立项 项 目 为 研究 对 象 ,基于 国家 社会 科学 基金 项 目的 外 部 特征 与 内 容 
特征 ,分 析 人 文 社会 科学 领域 中 数据 相关 研究 的 机 构 及 学 科 分 布 . 关 键 词 与 主题 聚 类 ,对 比 国家 社会 科学 基金 项 


知识 组 织 、 智 慧 人 文 服务 为 研究 发 展 趋势 。 
i: 数据 ”人文 社会 科学 ”国家 社会 科学 基金 
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: 10. 13266/j. issn. 0252 -3116.2021. 07. 002 


304 .00659v1 


研究 特征 


目 和 项 目 成 果 间 研究 热点 的 共同 性 与 差异 性 ,探测 数据 赋 能 的 人 文 社 会 科学 研究 趋势 。|[ 结果 /结论 ] 人 文 社会 
科学 领域 中 数据 问题 的 研究 以 大 数据 环境 、 信 息 行 为 与 信息 服务 .政府 数据 和 科学 数据 研究 为 重点 长 线 主题 ,以 
数据 库 建设 及 系统 设计 、 媒 体 平 台 及 服务 和 国际 问题 研究 为 次 要 热点 主题 ,以 融合 多 元 环境 、 开 放 数 据 管 理 、 延 伸 
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数字 经 济 背 景 下 ,数据 的 价值 未 渐 突显 并 成 为 社 
会 眉 展 的 关键 性 动力 。2020 年 4 月 9 日 ,我 国 出 台 的 
《 英 于 构建 更 加 完善 的 要 素 市 场 化 配置 体制 机 制 的 意 
见 》 属 数据 纳入 生产 要 素 范畴 ,提出 加 快 培养 数据 要 素 
市 吻 的 要 求 ,充分 体现 了 数据 的 基础 性 战略 资源 地 
位 转 。 作 为 对 社会 生活 与 社会 发 展 的 学 术 表 征 , 人 文 
HÓA LAE COR f AGREE) 研究 同样 视 数据 次 
源 为 重要 生产 要 素 和 核心 创新 资源 ,以 数据 为 驱动 促 
进 人 文 社 科研 究 的 纵深 化 发 展 。 一 方面 ,数据 驱动 模 
式 下 新 视角 .新 热点 的 产生 ,激发 人 文 社 科 的 研究 活 
力 ,拓展 人 文 社 科研 究 的 外 延 空间 ; 另 一 方面 ,在 数据 
密集 型 科学 研究 范式 下 新 特征 .新 路 径 的 形成 ,冲击 人 
文 社 科 的 传统 认 知 ,延伸 人 文 社 科研 究 的 内 涵 边 界 。 
为 在 新 范式 新 场景 下 把 握 人 文 社 科 领 域 中 与 数据 有 
关 研 究 的 发 展 情况 与 动态 趋势 ,本 研究 以 2010 - 2019 
年 这 10 年 间 国 家 社会 科学 基金 (以 下 简称 “ 社 科 基 
金 ") 各 类 型 立项 项 目 为 样本 ,利用 数据 统计 与 可 视 化 


U 
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工具 进行 分 析 , 解 析 近 10 年 来 人 文 社 科 领域 中 数据 研 
究 的 发 展 态势 , 理 清 数据 有 关 问 题 的 发 展 格局 .脉络 与 
前 沿 ,为 透视 数据 驱动 下 的 人 文 社 科研 究 提 供 窗 口 以 
及 为 新 文科 的 建设 提供 新 视角 。 


l 数据 驱动 的 人 文 社 科 领 域 研究 现状 


数据 作为 人 文 社 科 研究 人 员 认 识 研 究 问题 的 新 逻 
辑 起 点 ,突破 了 基于 文献 和 知识 探索 人 文 社 科研 究 的 
思维 标 相 , 引 发 众多 学 者 对 人 文 社 科 领 域 中 数据 问题 
的 不 同 视角 的 探讨 。 

在 基础 理论 研究 方面 ,相关 学 者 主要 考量 数据 思 
维 的 引入 为 人 文 社 科 研究 带 来 的 价值 与 风险 。 倪 万 等 
针对 数据 应 用 于 人 文 社 科研 究 中 的 基础 问题 ,指出 两 
者 的 结合 具有 原则 使 用 总 体 数据 实则 使 用 样本 数据 、 
数据 时 空 混杂 影响 精准 性 、 数 据 反映 相关 性 缺乏 因果 
性 等 问题 ,因而 人 文 社 科 研究 对 于 数据 思维 的 引入 要 
充分 考量 自身 研究 特性 与 数据 的 作用 方式 ”。 陈 泓 茹 
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等 指出 数据 思维 与 人 文 社 科研 究 的 融合 需要 确定 基本 
的 作用 限度 :其 一 ,数据 改变 人 文 社 科 研究 的 方式 与 存 


引发 的 隐私 ,安全 等 伦理 问题 ;其 四 ,数据 可 以 提升 人 
文 社 科研 究 的 精准 程度 ,然而 精准 化 并 不 等 同 于 研究 
的 科学 化 ""。 是 沁 等 指出 人 文 社 科研 究 过 程 中 存在 数 
据 需 求 迫 切 与 供给 不 足 ,数据 安全 管 护 与 隐私 侵犯 风 
险 , 数 据 客观 真实 与 算 改 造假 等 矛盾 ,人 文 社 科研 究 需 
要 促进 数据 资源 的 开放 ,构建 数据 管理 和 监督 机 制 .加 
强 数据 素养 的 培训 和 教育 。 

在 关键 技术 应 用 方面 ,相关 学 者 主要 探究 数据 相 
关 技 术 或 平台 为 人 文 社 科研 究 场景 和 组 织 架构 带 来 的 
变 莉 。 马 费 成 指出 在 数据 驱动 人 文 社 科 的 新 场景 下 ， 
二 科 的 研究 需要 开发 与 促进 数据 获取 、 存 储 \ 分 析 
现 阶段 的 有 形 研究 工具 ,通过 新 的 技术 工具 与 思 
和 法 改进 和 创新 人 文 社 科 研究 ”。 王 晓 光 认为 人 文 
社 和 领域 的 发 展 必须 以 数据 资源 建设 为 驱动 ,以 专题 
类 嘱 库 与 计算 平台 为 保障 ,通过 数据 资源 评价 标准 的 
dE, ,数据库 建设 流程 的 规范 数据 模型 技术 的 研发 、 
将 更 交汇 分 析 工 具 的 运用 ,管理 与 建设 人 文 社 科 数 据 
资源 = 。 谷 俊 等 针对 人 文 社 科 中 数据 溯源 能 力 弱 、 数 
据 十 途 追 踪 难 等 问题 ,采用 区 块 链 技术 设计 并 构建 了 
人 & 社 科 数 据 共享 联盟 平台 ,实现 数据 利用 的 共享 W 
USB EXT 。 同 时 ,人 文 社 科 数 据 开发 的 应 用 实践 也 
在 众多 高 校 或 研究 机 构 开 展 , 如 复旦 大 学 社会 科学 数 
据 击 台 旨 在 获取 组织 和 开发 社会 科学 数据 ,以 为 研究 
人 员 提 供 丰 富 、 及 时 的 数据 服务 ;南京 大 学 人 文 社会 
科学 大 数据 研究 院 旨 在 打破 人 文 社 科 的 信息 壁垒 , 束 
合 发展 和 提供 数据 资源 与 技术 ,以 推动 人 文 社 科 的 研 
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在 服务 体系 构建 方面 ,相关 学 者 主要 从 服务 层面 
探讨 数据 赋 能 模式 下 人 文 社 科 领 域 的 研究 创新 和 智慧 
服务 模式 的 建设 。 李 阳 等 通过 对 人 文 社 科 数 据 研究 的 
缘起 .脉络 和 特征 的 解析 ,指出 人 文 社 科 数据 研究 需 
从 数据 展示 的 浅 层 化 研究 向 知识 标识 的 智慧 化 和 意蕴 
化 方向 发 展 ,实现 具有 中 国 特色 的 人 文 社 科 数 据 研 究 
体系 。 米 加 宁 等 认为 数据 驱动 的 范式 推进 了 人 文 
社 科研 究 的 认识 论 与 方法 论 , 变 革 了 人 文 社 科研 究 的 
思路 与 模式 ,构建 了 多 元 集成 的 人 文 社 科学 术 研究 体 
系 ,但 同时 要 注重 人 文 社 科研 究 中 数据 应 用 技术 的 伦 
理 问题 和 人 文 社 科 新 场景 下 的 价值 挖 气 问 题 "。 刘 


雨 农 等 通过 分 析 数 据 驱动 模式 下 人 文 社 科研 究 的 现实 
困境 和 诉求 ,指出 人 文 社 科 创 新 研究 与 智慧 服务 的 构 
建 一 方面 需要 为 研究 人 员 开 展 数据 定制 、 协 助 处 理 \ 技 
术 指 导 、 智 慧 推送 等 服务 , 另 一 方面 需要 具备 数据 安全 
可 靠 、 服 务 专员 培训 数据 产权 明晰 等 制度 保障 '” 。 

综合 来 看 ,学 者 们 对 于 数据 驱动 人 文 社 科 领域 的 
研究 主要 体现 在 3 个 方向 :中 在 泛 在 知识 环境 下 ,考量 
引入 数据 思维 和 数据 背景 对 人 文 社 科研 究 带 来 的 理念 
变革 ;@ 关 注 数据 相关 技术 或 方法 对 人 文 社 科研 究 带 
来 的 发 展 机 遇 以 及 对 人 文 社 科 领 域 中 各 类 社会 现象 的 
解读 和 知识 发 现 平台 的 建设 ;@ 注 重 人 文 社 科 领 域 的 
数据 生态 体系 构建 ,以 系统 化 的 服务 促进 人 文 社 科 中 
数据 人 研究 的 智慧 化 发 展 。3 个 研究 方向 层 层 递 进 ,在 
一 定 程 度 上 描述 与 揭示 了 数据 融 于 人 文 社 科研 究 中 的 
共性 问题 。 在 现 有 学 者 研究 的 基础 上 ,为 把 握 数 据 应 
用 于 人 文 社 科 的 研究 动态 .研究 热点 以 及 研究 前 沿 ,本 
文 基于 文献 计量 ,在 整体 上 对 社 科 基金 立项 项 目 中 数 
据 有 关 项 目 进行 多 视角 的 实证 研究 ,在 局 部 分 析 社 科 
基金 项 目 成 果 论 文 的 知识 结构 ,以 从 宏观 上 把 握 数据 
驱动 的 人 文 社 科 研究 的 发 展 态势 ,从 微观 上 揭示 数据 
有 关 人 研究 的 细 粒 度 发 展 特 征 。 
2 研究 设计 
2.1 研究 思路 

社 科 基金 作为 我 国 在 人 文 社 科 领 域 最 具 权 威 与 影 
响 的 项 目 资助 和 管理 组 织 ,其 立项 项 目 通常 侧重 于 理 
论 前 沿 问 题 \ 政 策 导向 问题 和 重大 发 展 问 题 的 研 
究 ,在 一 定 程度 上 反映 出 人 文 社 科研 究 的 前 脆性 、 
发 展 性 与 交叉 性 ,折射 出 人 文 社 科研 究 的 动态 趋势 与 
发 展 态势 。 因 此 ,本 研究 首先 对 社 科 基金 项 目 中 与 数 
据 相 关 项 目的 年 度 立项 数量 与 项 目 类 别 、 工 作 单位 与 
学 科 类 别 进行 统计 分 析 , 从 立项 结构 纵 观 数据 赋 能 的 
人 文 社 科 研究 的 外 部 特征 与 整体 发 展 趋势 。 随 后 对 社 
科 基 金 项 目 及 项 目 成 果 进行 关键 词 分 析 与 研究 热点 对 
比分 析 ,关键 词 作为 对 研究 内 容 的 精确 凝练 ,能 在 一 定 
程度 上 代表 研究 的 重点 与 热点 。 研 究 热点 对 比分 析 则 
通过 预期 研究 与 实际 研究 的 内 在 内 容 比较 ,在 较 大 程 
度 上 实现 人 文 社 科 领 域 中 数据 研究 的 发 展 特征 解析 。 
最 后 综合 立项 项 目的 研究 主题 与 知识 特征 ,探测 与 发 
掘 数 据 驱 动 范式 下 人 文 社 科 领域 的 研究 生长 点 。 
2.2 数据 来 源 

本 研究 样本 数据 来 自 全 国 哲学 社会 科学 工作 办 公 
室 网 站 中 “项 目 查询 "下 设 的 “立项 查询 "系统 ,以 
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“数据 ”作为 关键 词 进行 搜索 ,搜集 与 统计 2010 - 2019 
年 间 与 数据 相关 的 各 项 立项 项 目 ,获得 有 效 立项 项 目 
952 项 ,具体 获取 项 目 批准 号 .项目 类 别 .学 科 分 类 、\ 项 
HA fk 立项 时 间 、 项 目 负责 人 专业 职务 .工作 单位 、 
单位 类 别 等 字段 内 容 。 同 时 ,使 用 中 国 知 网 获取 基金 
立项 项 目 资助 的 科研 论文 的 题 录 信 息 , 共 获取 科研 论 
文 5 293 篇。 
2.3 研究 方法 
本 研究 主要 采用 文献 计量 法 、 聚 类 分 析 法 和 内 容 

分 析 法 。 使 用 人 工 判读 的 形式 ,统一 立项 项 目 单位 名 
称 , 如 将 "中 山大 学 图 书馆 ”统一 为 “中 山大 学 ”。 使 用 
Excel 与 SPSS 25. 0 对 研究 数据 进行 汇总 、 统 计 与 图 表 
绘制 ,实现 对 人 研究 数据 的 外 部 特征 分 析 。 通 过 ROST 
co 文本 内 容 控 气 平台 实现 对 立项 项 目 和 科研 论文 
i9 芬 词 处 理 ， 同时 通过 人 工 识 别 的 形式 ,对 关键 词 进行 
MERD AIF ,如 剔除 "研究 “模式 “分 析 ” 等 无 特别 区 
分 民 的 词语 ,合并 “中 国 " 和 “我 国 "等 表述 不 同 但 内 涵 

| 同 的 词语 。 通 过 Ucinet 6. 186 软件 实现 关键 词 共 现 
ud fii FH Netdraw 2. 084 可 视 化 工具 生成 关键 词 共 现 
Khi, AA Gephi 0. 9. 2 对 研究 数据 进行 内 容 挖掘 处 
和 实现 主题 聚 类 分 析 。 最 终 在 此 基础 上 ,实现 对 研究 
6 AION 夺 征 分 析 。 


3 之 人 文 社 科 的 数据 研究 支撑 与 特点 分 析 


32 立项 年 度 分 布 分 析 

己 社 科 基 金 项 目 年 度 立 项 数量 的 变化 可 以 在 一 定 程 
度 下 反映 学 术 研究 的 发 展 水 平和 演化 过 程 ,也 可 以 从 
侧面 体现 学 术 研究 的 重要 程度 。2010 - 2019 年 社 科 基 
爹 项 目 中 数据 相关 项 目的 立项 情况 如 图 1 AR: 


200 


基金 项 目 数量 
ds oe | a 
o e © © 
E: 
dd 
g 
S E «e 
Un 
[repos ES 
- 
S — — 
| 
o 


0 
2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 


社 科 基金 项 目 年 份 


1 数据 相关 社 科 基金 项 目 年 度 统计 


从 图 1 可 知 , 社 科 基 金 项 目 中 数据 问题 的 相关 研 
究 开始 于 2010 年 ,兴起 于 2013 年 。 这 与 2009 年 数据 


密集 型 科学 研究 第 四 范式 的 提出 .2013 年 大 数据 技术 
的 广泛 应 用 具有 直接 相关 性 ,说 明 人 文 社 科 中 数据 问 
题 的 研究 与 社会 发 展 ,学术 环境 、 信 息 技术 具有 紧密 关 
联 。 对 各 年 度 的 社 科 基金 项 目 进行 趋势 拟 合 , 发现 社 
科 基 金 项 目 年 度数 量 较 符合 指数 型 分 布 ,前 期 增长 组 
慢 , 后 期 连续 6 年 立项 数量 达 100 项 以 上 ,说 明 数 据 问 
题 的 相关 人 研究 受到 国家 与 研究 人 员 的 持续 关注 ,重视 
程度 与 发 展 程度 呈现 稳步 提升 的 趋势 ,该 研究 具有 较 
好 的 发 展 空 间 与 生长 潜力 。 

为 掌握 数据 相关 立项 项 目的 具体 分 布 情况 ,明确 
数据 相关 问题 的 研究 粒度 ,笔者 对 社 科 基 金 项 目 按 立 
项 时 间 与 项 目 类 别 进 行 拆 分 统计 。 社 科 基 金 项 目 按照 
资助 额度 学 者 年 龄 .地 区 属性 的 不 同 , 共 设 有 8 类 立 
项 级 别 ,数据 相关 基金 项 目的 年 度 项 目 类 别 及 其 数量 
分 布 情况 如 表 1 所 示 : 

表 1 数据 相关 社 科 基金 项 目 类 别 分 布 


gp Ro X c En ru cr 
JiH MAH MAH 项 目 项 目 助 项 目 外 译 项 目 
2010 1 8 4 2 1 0 19 
2011 4 3 12 6 3 0 0 28 
2012 6 2 7 8 2 0 0 25 
2013 9 10 14 15 5 1 0 54 
2014 13 13 38 19 2 0 0 85 
2015 22 7 56 25 5 2 0 117 
2016 0 5 75 19 7 0 0 106 
2017 39 16 81 33 li 2 1 183 
2018 0 8 96 28 18 0 0 150 
2019 33 12 96 35 9 0 0 185 
合计 129 TI 483 192 64 6 1 952 


在 所 有 项 目 类 别 中 ,一 般 项 目 占 据 主体 地 位 ,青年 
项 目次 之 ,在 一 定 程度 上 说 明 国 家 对 中 青年 学 者 的 鼓 
励 与 注重 ,中 青年 学 者 成 为 人 文 社 科 中 数据 问题 研究 
的 中 坚 力量 ,预示 该 研究 具备 良好 的 发 展 前 景 。 重 大 
项 目 把 控 严 格 、 要 求 较 高 .立项 困难 ,数据 相关 社 科 基 
金 项 目 中 重大 项 目 数量 较 多 ,一 方面 反映 出 国家 对 数 
题 的 相关 研究 重视 程度 较 高 ,数据 问题 的 研究 与 

会 需求 契合 程度 较 强 ; 另 一 方面 显示 出 人 文 社 科 视 
ho e a Z3 7] ,研究 深度 正在 

逐步 加 强 ,研究 体系 正在 逐步 成 熟 。 

3.2 ”研究 机 构 分 析 

分 析 社 科 基 金 项 目 中 工作 单位 的 分 布 ,可 以 了 解 
数据 相关 研究 的 分 布 情况 ,从 侧面 反映 出 在 研究 中 具 
备 较 高 科研 水 平 的 机 构 。 在 952 项 基金 项 目 中 共有 
316 个 机 构 负 责 立 项 项 目 ,平均 每 个 机 构 负责 3 个 项 
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目 。 然 而 负责 3 个 及 以 上 项 目的 机 构 仅 96 个 ,说 明 人 | 3.3 学 科 分 布 分 析 
文 社 科 视 域 下 数据 问题 的 研究 呈现 出 集中 与 分 散 并 存 社 科 基金 立项 中 数据 相关 项 目的 学 科 分 布 特征 是 
的 不 均衡 现象 。 对 项 目 数量 在 10 个 及 以 上 的 工作 单 | 相关 学 理 文 撑 与 方法 支持 交互 作用 的 产物 ,分析 学 科 
位 进行 统计 分 析 ,具体 如 表 2 Bron : 演变 特点 有 助 于 把 握 人 文 社 科 领 域 中 数据 研究 的 学 科 
表 2 数据 相关 社 科 基金 项 目 工作 单位 统计 建设 情况 ,探测 数据 研究 的 外 部 发 展 方向 与 动态 趋势 。 
工作 单位 项 目 数 量 所 属地 域 为 直观 分 析 数 据 相 关 研 究 的 学 科 发 展 变 化 ,绘制 如 图 
中 国人 民 大 学 21 北京 2 所 示 的 学 科 演变 图 谱 。 
中 山大 学 15 广东 从 学 科 分 布 演变 情况 来 看 ,在 整体 上 ,人 文 社 科 领 
南京 大 当 15 江苏 3 " A ` | 
bii à i. 域 中 与 数据 相关 的 研究 旦 现 百花 齐 放 的 样 态 ;在 局 部 
币 寺 信子 E 
Non y pn 上 ,图 书馆 ,情报 与 文献 学 ,统计 学 和 管理 学 3 个 学 科 
pt "s 的 社 科 基金 项 目 数量 与 项 目 增长 量 明显 突出 ,是 数据 
复旦 大 学 11 上 海 研究 的 主要 学 科 。 新 闻 学 与 传播 学 .语言 学 两 个 学 科 
北京 师范 大 学 n 北京 的 社 科 基金 项 目 数量 居中 ,呈现 持续 增长 状态 ,是 数据 
二 一 武汉 大 学 H "i 研究 的 潜在 发 展 学 科 。 
ra Polit i 图 书馆 .情报 与 文献 学 作为 对 数据 资源 进行 获取 、 
华 工大 学 Ld " e /= Z BB H 
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图 2 数据 相关 社 科 基 金 项 目 学 科 分 布 演变 图 谱 


论 . 技 术 方 法 \ 应 用 工具 的 学 科 … ,自身 就 是 数据 资源 
的 重要 集散 地 ,因而 展开 数据 问题 的 研究 是 图 书馆 、 情 
报 与 文献 学 发 展 的 必然 之 势 和 长 久之 道 。 统 计 学 作为 
植 根 于 数学 的 学 科 ,数据 贯穿 于 学 科研 究 的 始终 ,因此 
对 数据 问题 的 研究 必然 会 较为 突出 。 管 理学 是 对 社会 
管理 活动 进行 研究 的 一 门 学 科 , 具 备 广泛 性 与 交叉 
VEUT ,数据 思维 和 技术 方法 的 发 展 ,逐渐 改变 社会 的 
生产 力 与 生产 关系 ,引发 管理 要 素 、 管 理 思 维 、 管 理 边 
界 的 持久 变化 ,促使 管理 学 科 的 研究 转向 数据 要 素 带 
来 的 长 期 管理 变革 。 因 此 ,图 书馆 、 情 报 与 文献 学 \ 统 
计 学 和 管理 学 3 个 学 科 既 是 人 文 社 科 视 域 下 数据 问题 


现 有 研究 的 主要 学 科 ,也 是 未 来 深度 发 展 的 重要 支撑 
学 科 。 

新 闻 学 与 传播 学 作为 对 新 闻 活 动 的 传播 以 及 新 闻 
与 社会 关系 研究 的 学 科 , 本 质 是 对 数据 加 工 形成 的 有 
效 文本 信息 进行 研究 ” ,其 学 科 的 发 展 有 赖 于 对 数据 
资源 的 挖掘 、 利 用 与 服务 。 语 言 学 是 对 语言 的 本 质 、 发 
展 规律 进行 研究 的 一 门 学 科 … ,需要 对 大 量 语 料 数据 
进行 组 织 分 析 ,得 出 统计 规律 ,实现 对 语言 系统 运作 机 
理 的 解释 和 对 语言 结构 演化 规律 的 认 知 。 作 为 对 数据 
资源 加 工 形成 的 二 次 信息 资源 的 分 析 和 对 数据 技术 方 
法 的 应 用 ,新 闻 学 与 传播 学 ,语言 学 的 建设 与 研究 发 展 
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需要 长 期 在 数据 驱动 模式 下 拓展 其 研究 要 素 .深化 其 
学 科 内 涵 、 创 新 其 学 科 体 系 。 因 此 ,新闻 学 与 传播 学 、 
语言 学 的 发 展现 状 与 长 期 发 展 要 求 预示 其 将 成 为 人 文 
社 科 视 域 下 数据 问题 研究 的 主要 趋势 学 科 。 


4 人 文 社 科 的 数据 研究 重点 分 析 


分 析 数 据 问题 的 研究 特点 可 以 从 宏观 层面 展现 人 
文 社 科 领 域 中 数据 研究 的 外 部 演化 特征 ,为 深入 探析 
数据 问题 的 具体 研究 重点 ,还 需 从 微观 层面 揭示 数据 
研究 的 内 在 内 容 特征 。 为 全 面 发 据 数据 问题 的 研究 重 
点 ,透视 数据 研究 的 发 展 趋势 ,本 研究 对 社 科 基金 项 目 


202304.00659v1 
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从 图 3 可 以 看 出 ,人 文 社 科 视 域 下 数据 问题 的 研 
究 主要 以 大 数据 .数据库 .中 国 治理、 创新 等 为 主要 关 
键 词 。“ 大 数据 "出 现 的 频次 为 492 次 ,具有 绝对 优势 。 
在 2013 年 大 数据 元 年 后 ,大 数据 以 势不可挡 的 态势 在 
各 行 各 业 探索 实践 ,改变 各 领域 的 生产 经 营 模式 和 管 
理 形式 ,影响 大 众 的 思想 意识 和 生活 方式 ,因而 大 数据 


及 其 资助 的 科研 论文 分 别 进行 研究 热点 识别 ,并 展开 
对 比分 析 。 
4.1 立项 项 目 关键 词 及 主题 内 容 分 析 

本 研究 的 数据 源 为 社 科 基金 项 目 名 称 ,项 目 名 称 
一 般 由 研究 角度 .背景 和 内 容 组 成 ,可 以 从 侧面 体现 立 
项 项 目的 核心 要 点 "” 。 通 过 对 立项 项 目 进行 关键 词 
分 析 , 生 成 社 科 基 金 项 目 关键 词 图 谱 , 见 图 3 ( Top20, 
MX 43). 。 借 鉴 大 数据 模型 中 的 降 维 和 聚 类 算法 , 通 
过 模块 度 和 随机 算法 进行 主题 聚 类 分 析 ,梳理 并 归纳 
社 科 基金 立项 项 目的 研究 热点 和 方向 ,如 图 4 所 示 : 


EL] a LPS. 
ZZ S 77 4 Fs 
ix I NA 


不 可 避免 地 成 为 人 文 社 科 领域 中 数据 问题 的 关键 研究 
要 点 。“ 数 据 库 ”出 现 206 次 ,说 明 对 资源 进行 组 织 、 建 
设 和 保存 仍 是 研究 人 员 较 为 关注 的 问题 。“ 中 国 ” 出 
现 123 次 ,这 与 国家 社 科 基金 项 目 是 从 国家 层面 出 发 ， 
统筹 考虑 和 研究 我 国 社会 发 展 问 题 具 有 直接 相关 性 。 
“治理 "出 现 62 次 ,这 与 十 八 届 三 中 全 会 提出 从 社会 管 
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理 转向 社会 治理 有 关 ,说 明 人 文 社 科 的 研究 紧 跟 国 
家 发 展 方略 和 导向 ,注重 对 社会 突出 问题 的 解决 ,体现 
人 文 社 科 研究 的 现实 意义 。“ 创 新 "出现 58 次 ,说 明 数 
据 驱 动 的 新 发 展 方式 和 思维 方法 在 促进 社会 进步 、 创 
新 发 展 的 同时 ,为 人 文 社 科 研究 也 带 来 新 的 发 展 路 径 
或 模式 。 

为 更 加 精准 地 分 析 数 据 问题 的 研究 重点 ,本 研究 
通过 Gephi 团体 发 现 分 析 进 行 聚 类 ,Gephi 利用 随机 算 
法 .分割 模块 等 实现 群 组 分 解 与 聚合 ,相对 于 Ucinet 可 
以 更 加 直接 优化 地 分 解 聚 类 结果 , 聚 类 结果 一 般 通 过 
节点 大 小 和 节点 颜色 进行 标识 ,节点 越 大 则 表示 关键 
词 的 关联 影响 力 越 强 串 ] ,具体 见 图 4。 通 过 人 工 判读 ， 
发 现 突 发 事件 相关 立项 项 目 丝 以 大 数据 为 背景 ,可 以 
与 块 数据 环境 研究 的 类 目 合并 , 即 近 10 年 来 数据 相关 
的 枚 金 项 目 研究 可 以 总 结 为 :以 大 数据 环境 为 重要 研 
ER ,注重 信息 服务 .数据 开放 等 服务 行为 的 研究 ， 
泽 鲁 数据 库 建设 等 保障 行为 的 研究 。 反 映 出 人 文 社 科 
售 志 注重 将 社会 发 展 的 时 代 背 景 与 科学 研究 有 机 结 
会 s 你 现 人 文 社 科研 究 的 社会 价值 ,同时 ,注重 用 户 i 
麻 笨 研究 人 员 的 数据 服务 行为 ,体现 人 文 社 科研 究 的 
XS 
@D(1 ) 基 于 大 数据 环境 的 研究 。 作 为 当今 时 代 发 展 


的 型 要 背景 ,大 数据 既是 社会 发 展 的 一 种 现象 ,也 是 人 
文 程 科 领 域 中 数据 研究 的 绝对 热点 。 通 过 对 项 目 主题 
的 深入 分 析 发 现 ,大 数据 与 人 文 社 科 领 域 充分 融合 , 利 


用 央 数 据 思 维 能 够 全 面 深化 研究 内 容 , 解 决 社会 发 展 
问题 ,构建 学 科 发 展 体系 ,突出 人 文 社 科 的 研究 价值 。 
一 范 面 ,大 数据 时 代 引 发 全 面 变 革 , 从 国家 战略 发 展 到 
社会 预警 治理 ,从 社会 管控 应 急 到 网 络 信息 安全 、 从 次 
源 环境 优化 到 产业 结构 升级 、 从 学 科 发 展 创新 到 教育 
方式 变革 ,社会 发 展 ,管理 模式 .思维 方式 .科学 研究 等 
各 方面 已 经 与 大 数据 紧密 结合 。 另 一 方面 ,大 数据 作 
为 技术 方法 ,以 其 多 元 海量 、 层 级 复杂 全 面 真实 的 计 
算 特 征 ,冲击 人 文 社 科 领 域 的 传统 研究 方法 ,催生 出 数 
据 挖掘、 机 器 学 习 、 隧 合计 算 等 新 兴 技 术 与 方法 ,促进 
人 文 社 科研 究 的 全 领域 .深层 次 和 创新 化 发 展 。 细 化 
而 言 ,通过 对 2013 - 2019 年 图 书馆 .情报 与 文献 学 有 
关 大 数据 立项 项 目的 分 析 可 以 发 现 ,大 数据 立项 项 目 
大 致 可 以 分 为 3 个 阶段 ,第 一 阶段 是 大 数据 背景 下 ,有 
关 信息 安全 ,图 书馆 用 户 服务 等 的 研究 ;第 二 阶段 是 大 
数据 技术 下 ,有 关 多 层级 文本 挖掘 .语义 挖掘 、 与 情 监 
测 .企业 服务 等 的 研究 ;第 三 阶段 是 大 数据 生态 下 ,有 
关 智 库 、 人 才 库 构建 与 评价 .科教 评价 平台 构建 .档案 


服务 平台 构建 等 的 研究 。3 个 阶段 的 大 数据 立项 项 目 
也 与 前 述 诸多 学 者 对 数据 驱动 人 文 社 科 领域 的 3 个 研 
究 方向 相 契 合 。 

(2) 信息 行为 与 信息 服务 研究 。 满 足 用 户 信息 需 
求 的 服务 研究 也 是 人 文 社 科 领 域 中 数据 研究 的 重点 主 
题 , 反 映 出 对 民生 问题 的 高 度 重 视 和 对 实际 问题 的 有 
效 解决 能 力 。 运 用 多 源 数据 和 技术 方法 ,将 受众 为 主 
要 形式 的 被 动 服务 转化 为 以 用 户 为 中 心 的 主动 服务 模 
式 ,进而 通过 个 性 化 推荐 和 精准 供给 满足 用 户 各 层次 
的 需求 是 信息 服务 研究 的 主要 内 容 。 在 信息 服务 对 象 
方面 ,包括 学 生 、 青 年 ,老年 人 和 企业 ,用 户 群 体 多 样 、 
层次 分 明 ,能 切实 有 效 地 反映 或 解决 各 层次 用 户 的 不 
同 信息 需求 服务 ;在 信息 服务 主体 方面 ,包括 政府 部 门 
公共 服务 .图 书馆 的 智慧 服务 、 档 案 馆 的 数字 服务 ， 
公共 服务 体系 对 用 户 信息 需求 的 预测 ,用户 行 为 
的 掌握 .服务 能 力 的 提升 和 服务 质量 的 改进 研究 ;在 信 
息 服 务 内 容 方面 ,关注 基于 知识 的 智慧 信息 服务 、 基 于 
本 体 的 个 性 化 推荐 服务 .基于 感知 的 细 粒 度 人 性 化 服 
务 等 内 容 ,优化 用 户 服务 体系 , 紧 跟 社会 发 展 重 点 , 体 
现 研究 的 理论 价值 与 实践 意义 。 

(3) 数 据 库 建 设 及 系统 设计 研究 。 数 据 库 建设 将 
分 散 无 序 的 资源 进行 系统 化 ,深层 化 和 有 序 化 组 织 , 将 
传统 资源 抽取 、 整 理 和 加 工 形成 数字 资源 ,利于 网 络 传 
播 \ 存 取 和 使 用 , 重 现 和 拓展 资源 的 使 用 价值 。 数 据 库 
建设 的 相关 研究 侧重 以 特色 数据 库 为 导向 ,实现 资源 
的 共享 ,拓宽 服务 的 空间 。 研 究 内 容 旦 现 多 元 化 特征 ， 
具体 包含 从 初始 的 多 民族 语言 词汇 、 非 物质 文化 遗产 、 
古籍 文献 资源 等 静态 数据 库 的 建设 ,到 国际 关系 、 用 户 
行为 .各 国 华文 教育 等 动态 数据 库 的 建立 ,再 到 语音 、 
影像 等 有 声 数据 库 的 构建 。 说 明 数 据 技术 的 发 展 为 资 
源 提 供 了 有 效 地 开发 .采集 、 著 录 、 检 索 、 交 互 等 能 
同时 各 学 科 领 域 的 特色 数据 库 建 设 为 人 文 社 科研 究 的 
纵深 化 发 展 竟 定 了 坚实 的 知识 型 数据 基础 。 

(4) 政 府 数据 相关 问题 研究 。 政 府 数据 蕴含 丰富 
的 社会 价值 与 经 济 价值 ,激活 数据 资源 可 以 充分 释放 
政府 数据 的 红利 。 政 府 数据 相关 的 研究 主要 体现 在 3 
个 方面 ,一 是 政府 数据 的 开放 研究 ,包括 数据 开放 的 体 
系 建立 、 开 放 平 台 的 机 制 建设 .开放 共享 的 风险 防范 和 
保护 策略 研究 ;二 是 政府 数据 的 治理 研究 ,包括 治理 机 
理 的 探究 .社会 与 情 的 治理 策略 治理 平台 和 体系 的 建 
立 ; 三 是 政府 数据 的 评价 研究 ,包括 廉政 建设 的 评价 、 
网 络 传播 力 的 评价 。 说 明 政 府 数 据 以 开放 、 融 通 、 治 
理 .应 用 和 评价 为 关键 ,研究 视角 多 元 ,研究 内 容 多 样 。 
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同时 ,重视 政府 数据 的 应 用 效果 ,表明 相关 研究 已 从 注 
重 机 理 分 析 进 入 到 关注 实践 评价 的 新 阶段 ,反映 出 政 
府 数据 研究 的 系统 性 务实 性 和 实用 性 。 

(5) 科 学 数据 相关 问题 研究 。 科 学 数据 作为 科学 
假设 .科学 分 析 以 及 科学 理论 形成 的 基础 , 较 大 程度 上 
决定 了 科学 研究 的 质量 ,并 且 科学 数据 的 可 再 利用 性 、 
可 再 分 析 性 和 可 信 度 使 其 具有 可 挖掘 的 扩展 价值 。 科 
学 数据 的 研究 以 发 现 .获取 .理解 和 重用 为 关键 ,具体 
包括 科学 数据 的 开放 政策 研究 .开放 模式 分 析 、 关 联 关 
系 挖掘 ,引用 机 制 实现 和 影响 因素 探究 ,尤其 是 开放 获 
取 成 为 研究 的 主要 焦点 ,表明 科学 数据 的 研究 尚 处 于 
初期 发 展 阶段 ,可 以 预见 对 其 理论 基础 的 深入 挖掘 、 理 
论 体系 的 构建 .管理 机 制 的 探索 .创新 实践 的 应 用 将 成 
为 后 续 研 究 的 重点 。 

42 项 目 成 果 关 键 词 及 主题 内 容 分 析 

L 〇 作为 社 科 基金 项 目的 重要 承载 形式 ,科研 论文 从 
选 是 确立 到 撰写 发 表 的 全 过 程 都 会 经 过 研究 人 员 的 广 
泛 研 讨 和 深入 论证 ,在 较 大 程度 上 表征 了 立项 项 目的 
深 庆 研究 内 容 和 具体 研究 方向 ,分 析 科 研 论文 的 关键 
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词 和 主题 词 可 以 更 具 化 地 体现 科研 人 员 实 际 研究 重 
点 ,以 此 突 探 与 拓展 人 文 社 科 中 的 数据 研究 热点 。 由 
于 立项 项 目的 分 析 对 和 象 为 标题 ,基于 此 ,本 研究 获取 立 
项 项 目 资助 的 科研 论文 标题 数据 ,通过 论文 标题 分 词 、 
词 频 统 计 关键 词 共 现 和 聚 类 分 析 的 形式 ,探测 和 分 析 
项 目 成 果 的 研究 热点 与 重点 。 

从 图 5 可 以 看 到 ,科研 论文 的 研究 重点 与 立项 项 
目的 研究 重点 具有 一 定 相 似 性 ,如 “大 数据 ”和 “中 国 ” 
具有 绝对 优势 ,但 同时 也 发 展 出 新 的 研究 要 点 ,如 “网 
络 ”" 和 “信息 ” ,进一步 验证 了 科研 论文 是 对 立项 项 目 
的 具体 表征 ,也 是 对 立项 项 目的 内 涵 发 展 。“ 中 国 ” 出 
34625 次 ,“ 大 数据 ”出 现 500 次 , “服务 "出现 187 次 ， 
“开放 ”出现 141 次 ,说 明基 于 大 数据 环境 的 研究 .针对 
用 户 服务 的 研究 和 促进 数据 开放 的 研究 仍然 是 数据 相 
关 研 究 的 热点 和 前 沿 内 容 。“ 网 络 ” 出 现 326 次 ， 信 
息 ” 出 现 253 次 ,“ 知 识 ” 和 “技术 ”出 现 136 次 ,信息 是 
基础 ,知识 是 延伸 ,技术 是 手段 ,网 络 是 平台 ,研究 之 间 
相互 关联 ,呈现 出 系统 化 \, 泛 在 化 和 应 用 化 特征 


o 


图 5 数据 相关 科研 论文 的 关键 词 图 谱 


根据 图 6 所 示 的 Gephi 聚 类 结果 ,结合 人 工 判 读 ， 
可 以 看 到 有 关 大 数据 、 信 息 服务 和 数据 开放 的 研究 依 
旧 是 数据 研究 的 前 沿 主 题 ,同时 知识 管理 、 新 媒体 平台 
和 国际 问题 是 数据 研究 的 新 动向 ,说 明 人 文 社 科 和 领域 
对 数据 问题 的 研究 在 实践 中 得 以 拓展 ,注重 知识 转化 
的 智慧 服务 社交 媒体 中 的 泛 在 信息 传播 和 国际 视野 
下 的 国家 发 展 问题 , 紧 跟 社会 发 展 热点 ,突显 时 代 特 
征 。 

(L) 知识 组 织 与 管理 研究 。 知 识 作为 创新 的 内 在 
驱动 ,是 促进 社会 发 展 、 激 发 科研 活力 的 重要 推动 力 。 
人 文 社 科 领域 中 数据 问题 的 研究 呈现 出 “数据 - 信息 
-知识 "的 发 展 脉络 ,从 数据 开发 .获取 等 表象 行为 深 


入 到 信息 资源 的 建设 与 管理 过 程 ,再 到 语义 分 析 、 知 识 
生产 ,知识 挖掘 .知识 共享 等 知识 的 组 织 和 服务 模式 ， 
说 明 数 据 问题 的 研究 从 信息 化 逐渐 转向 知识 的 发 掘 利 
用 和 知识 需求 的 满足 服务 ,知识 化 成 为 数据 研究 的 重 
要 内 容 。 

(2) 媒 体 平台 及 服务 研究 。 社 会 媒体 是 以 互联 网 
技术 为 基础 ,以 用 户 生 成 信息 为 内 容 , 以 多 向 传播 为 目 
的 的 大 众 化 媒体 ,包含 丰富 的 多 源 信 息 ,蕴含 巨大 的 社 
会 价值 .经济 价值 与 学 术 价值 。 社 会 媒体 的 相关 研究 
主要 体现 在 两 个 方面 ,一 是 在 泛 在 信息 环境 下 ,利用 用 
户 信息 数据 以 及 大 数据 技术 实现 用 户 行为 与 信息 传播 
模式 的 研究 ;二 是 在 信息 异化 的 现象 下 ,展开 用 户 隐 私 
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与 动态 监测 管理 的 研究 。 说 明 数 据 研究 在 注重 挖 
会 媒体 数据 资源 的 同时 ,关注 人 性 化 发 展 与 人 文 
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OG) 国际 问题 相关 研究 。 利 用 数据 资源 与 数据 技 
:得 全 面 的 事实 信息 是 国际 问题 研究 的 新 方式 。 
国际 问题 的 研究 主要 关注 国际 关系 问题 与 国际 经 济 问 
题 ,具体 包括 “一 带 一 路 "倡议 .国际 竞争 力 分 析 、 国 际 
公 讲 卫生 合作 .国际 关系 冲突 预测 .资本 市 场 竞 争 . 国 
际 疙 本 流动 .国际 贸易 关系 等 。 在 无 边界 网 络 环境 下 ， 
各 图 交 往日 益 密 切 ,各 要 素 流动 自由 便利 ,如 何 把 握 数 
据 资源 创造 新 的 发 展 机 遇 , 提 升 能 级 是 人 文 社 科 领域 
中 昭 据 研究 必须 重视 的 问题 。 


社 科 基 金 项 目 作 为 社会 发 展 问题 的 表征 具有 全 局 
性 和 概括 性 ,项 目 成 果 作 为 社 科 基金 项 目 在 实际 研究 
中 的 高 度 凝 练 ,具有 延展 性 和 粒度 化 。 通 过 对 二 者 的 
研究 热点 进行 对 比 与 融合 , 既 可 体现 数据 驱动 人 文 社 
科 的 预期 研究 前 沿 ,又 可 表征 实践 研究 中 的 实际 内 容 
应 用 ,从 而 在 较 大 程度 上 解析 人 文 社 科 领 域 中 数据 研 
究 的 特征 与 价值 。 可 以 看 到 ,大 数据 背景 .信息 服务 和 
数据 开放 3 个 研究 主题 是 数据 研究 中 的 重要 长 线 主 
题 , 数 据 库 建 设 、 新 媒体 平台 和 国际 问题 3 个 研究 主题 
是 数据 研究 的 次 要 热点 主题 。 总 体 而 言 , 社 科 基 金 项 
目 和 项 目 成 果 的 研究 热点 呈现 关键 主题 趋同 ,部 分 主 
题 存 异 的 特点 。 
4.3.1 关键 研究 主题 趋同 

大 数据 背景 ,信息 服务 和 数据 开放 作为 长 线 研究 


图 6 数据 相关 科研 论文 的 研究 趋势 


主题 在 社 科 基 金 项 目 和 项 目 成 果 中 较 受 注重 ,并 且 均 
与 大 数据 发 展 战略 .信息 服务 战略 .数据 开放 纲要 等 国 
家 重大 战略 思想 和 国家 宏观 政策 相 契 合 。 同 时 注重 服 
务 于 人 ”的 研究 ,如 大 数据 背景 下 的 消费 者 行为 研 
究 .个 人 信息 安全 研究、 科研 数据 用 户 使 用 模式 研究 
等 ,体现 出 数据 研究 注重 人 文 关怀 和 人 本 服务 。 人 作 
为 社会 的 主体 ,是 数据 资源 的 使 用 者 .知识 文化 的 创造 
者 、 创 新 发 展 的 推动 者 ,满足 用 户 需求 、 便 利用 户 行径 、 
保障 用 户 权 益 是 人 文 社 科研 究 的 经 久 重 点 和 必然 要 
点 。 
4.3.2 部 分 研究 主题 存 异 

社 科 基金 项 目 注重 对 数据 库 的 建设 研究 ,说明 社 
科 基 金 项 目 重视 数据 资源 的 基础 性 和 支撑 性 作用 。 专 
题 数 据 库 的 建设 通过 对 数据 的 处 理 和 组 织 , 实 现 数据 
的 集合 ,便于 数据 资源 的 控制 . 调 取 维护 和 共享 ,充分 
发 挥 数据 的 可 用 价值 ,为 人 文 社 科研 究 在 数字 空间 中 
的 繁荣 发 展 莫 定 资源 基础 。 项 目 成 果 则 注重 对 新 媒体 
平台 与 国际 问题 的 研究 ,说 明 项 目 成 果 重 视 社 会 现象 ， 
时 效 性 、 贴 合 性 强 。 自 大 数据 等 先进 技术 兴起 、 互 联网 
+ 新 业态 的 发 展 , 新 媒体 平台 日 趋 兴盛 ,越发 成 为 用 户 
生活 中 不 可 或 缺 的 一 部 分 ,新 信息 环境 下 对 用 户 行 为 
模式 的 新 特征 探索 一 直 作为 社会 交互 和 科学 研究 的 热 
点 。 在 国际 联系 越发 紧密 ,我 国 相继 提出 “加 快 培育 国 
际 合作 和 竞争 新 优势 指导 意见 ”、 共 建 “ 一 带 一 路 ”的 
顶层 合作 倡议 等 政策 后 ,我 国 已 置身 于 国际 视野 ,在 不 
同 社会 发 展 背景 和 国际 关系 中 探寻 国际 问题 ,发 掘 竞 
争 优 势 成 为 国家 发 展 、. 社 会 研究 的 持续 热点 内 容 。 
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5 人 文 社 科 的 数据 研究 趋势 透视 

梳理 国内 有 关 人 文 社 科 和 领域 中 数据 研究 的 文献 内 
容 ,结合 数据 问题 的 研究 热点 ,本 研究 认为 未 来 人 文 社 
科 视 域 下 数据 问题 的 研究 将 在 研究 背景 、 研 究 对 象 . 研 
究 内 容 和 研究 体系 中 实现 突破 ,呈现 情景 综合 化 应 用 
广泛 化 .资源 知识 化 和 服务 人 本 化 的 特征 趋势 。 

融合 时 代 特 征 , 紧 跟 时 代 潮 流 。 人 文 社 科研 究 深 
受 国 家 战略 ,政策 制度 、 社 会 环境 和 国际 关系 的 影响 ， 
必须 紧 抓 时 代 发 展 潮流 ,保持 研究 的 有 效 性 和 先进 性 。 
在 5G 时 代 到 来 ,大 数据 技术 深化 、 国 际 竞 合 紧密 的 背 


景 下 ,数据 实现 泛 在 聚合 与 共享 ,数据 的 协同 价值 越发 
突出 ,如 何在 新 时 代 背 景 下 ,充分 实现 数据 驱动 的 热点 
研究 内 容 持 续 化 和 深度 化 发 展 ,融入 新 概念 与 新 视角 
纳 按 掘 研究 生长 点 ,保持 研究 的 增长 活力 是 人 文 社 科 


英 钢 数据 的 流动 与 共享 , 另 一 方面 改变 知识 交流 的 生 
污 雅 动 经 济 社会 的 发 展 “! 。 开 放 数据 研究 是 数据 相 
关 研 究 的 重要 组 成 部 分 ,然而 有 关 研究 尚 处 于 探索 发 
要 隐 段 ,具有 较 大 发 展 前 景 。 如 何 增强 数据 共享 意识 、 
贿 电 开放 标准 保障 开放 机 制 完善 基础 设施 .促进 实 
践 呈 用 和 建立 评价 体系 都 是 开放 数据 研究 中 亟待 解决 
的 问题 ， 

. 达 重 视 数据 挖掘 ,延伸 知识 组 织 。 数 据 思维 和 数据 
抄 玉 促使 信息 组 织 内 容 发 生变 化 ,从 数字 化 阶段 向 数 
据 由 变革。 信息 组 织 工 具 从 传统 受 控 词 表 向 语义 网 络 
发 展 ,信息 组 织 内 容 则 基于 语义 层级 的 变化 向 知识 组 


知识 挖掘 和 知识 识别 集成 元 数据 语义 数据 和 关联 数 
据 是 实现 语义 化 知识 组 织 和 管理 的 有 效 突破 口 。 

数据 作为 资源 ,智慧 人 文 服务 。 科 学 研究 价值 的 
实现 需要 服务 于 人 类 与 社会 ,注重 用 户 需 求 .关注 用 户 
行为 .提升 用 户 服务 ,是 人 文 社 科 研究 的 价值 所 在 。 在 
数据 驱动 范式 下 ,智慧 数据 发 展 . 智 能 技术 升级 ,实现 
智慧 与 人 文 的 耦合 ,实现 数据 成 果 与 人 文 服务 的 同 频 
共振 ,是 人 文 社 科 领域 中 数据 研究 的 重要 导向 。 


6 结语 


本 研究 对 近 10 年 的 数据 相关 社 科 基金 项 目 展 开 
分 析 , 导 在 把 握 人 文 社 科 研究 中 与 数据 有 关 的 研究 支 
撑 与 特点 以 及 研究 重点 与 趋势 ,形成 对 数据 研究 的 整 
体 性 认识 。 在 研究 支撑 与 特点 上 ,数据 研究 存在 学 科 
与 地 域 偏差 。 为 实现 数据 研究 的 可 持续 发 展 ,今后 应 


注重 跨 学 科 、 跨 地 域 的 有 机 结合 与 协同 合作 ,促进 数据 

研究 的 横向 渗透 交叉 和 纵向 继承 发 展 。 在 研究 重点 与 

趋势 上 ,数据 研究 以 大 数据 与 国际 环境 为 背景 ,形成 

“数据 -信息 -知识 - 服务 "的 研究 主线 ,研究 层次 丰 

富 饱 满 。 数 据 为 人 文 社 科研 究 带 来 生机 与 活力 ,协同 

数据 理论 的 本 源 思考 与 数据 应 用 的 本 位 研究 ,促进 人 

文 社 科研 究 的 智慧 化 转型 是 人 文 社 科 领 域 中 数据 研究 

的 重要 态势 。 
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Abstract: | Purpose/significance | Under the background that data has become a key factor of production and 
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Cbàsic strategic resources, this paper reviewed the research status of data data-related research in the field of humani- 
ties and social sciences, reveals the research trend of data problems, and provided a window for the perspective of 
anities and social sciences research driven by data. | Method/process | Taking the National Social Science Fund 
(Project about " data" of 2010 — 2019 as the research object, this paper based on the external characteristics and con- 
Geht characteristics of the fund project, analyzed the distribution of data-related research institutions and disciplines, 
eyword and topic clustering in the field of humanities and social sciences, compared the commonness and differences 
a hotspots between fund projects and project achievements, and explored the research trends of humanities 
Pi social sciences empowered by data. | Result/conclusion | The research on data issues in the field of Humanities 
and Social Sciences focuses on the long-term theme of big data environment, information behavior and information 
gervice, government data and scientific data research , the secondary hot topics are database construction and system 
aign, media platform and service and international issues research, and the integration of multiple environment, 
open data management, extension of knowledge organization and wisdom humanities service are the research develop- 
ment trend. 


Keywords: data humanities and social sciences the National Social Science Fund research characteristics 
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